多种统计和机器学习方法用于使用机器学习方法在特定道路上建模崩溃频率,通常具有更高的预测准确性。最近,包括堆叠在内的异质集合方法(HEM)已成为更准确和强大的智能技术,并且通常通过提供更可靠和准确的预测来解决模式识别问题。在这项研究中,我们将堆叠的关键下摆方法之一应用于城市和郊区动脉的五个车道段(5T)上的崩溃频率。将堆叠的预测性能与参数统计模型(泊松和负二项式)和三种最先进的机器学习技术(决策树,随机森林和梯度增强)进行了比较,每种技术都被称为基础学习者。通过采用最佳的体重方案通过堆叠结合单个基础学习者,由于规格和预测准确性的差异,各个基础学习者中有偏见的预测问题可以避免。从2013年到2017年收集并集成了包括崩溃,流量和道路清单在内的数据。数据分为培训,验证和测试数据集。统计模型的估计结果表明,除其他因素外,崩溃随着不同类型的车道的密度(每英里数)的增加而增加。各种模型的样本外预测的比较证实了堆叠优于所考虑的替代方法的优越性。从实际的角度来看,堆叠可以提高预测准确性(与仅使用具有特定规范的基本学习者相比)。当系统地应用时,堆叠可以帮助确定更合适的对策。
translated by 谷歌翻译